Методи вивчення кореляційних зв`язків

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Пензенська ДЕРЖАВНИЙ УНІВЕРСИТЕТ
Медичний інститут
Кафедра гігієни, громадського здоров'я та охорони здоров'я
(Зав. кафедрою к.м.н. А. П. Дмитрієв)
МЕТОДИ вивчення кореляційних зв'язків
Навчально-методичний посібник для студентів
(VШ семестр)
м. Пенза, 2005.

Інформаційний лист:
Навчально-методичний посібник "Методи вивчення кореляційних зв'язків." Підготовлено кафедрою гігієни, громадського здоров'я та охорони здоров'я Пензенського державного університету (завідувач кафедри, к.м.н. Дмитрієв О.П.).
У складанні брали участь: к.м.н. Зубріянова Н.С. , Дмитрієв О.П. (Відповідальний за підготовку Зубріянова Н.С.).
Навчально-методичний посібник підготовлено відповідно до «Програми по громадському здоров'ю та охорони здоров'я" для студентів лікувальних факультетів вищих медичних навчальних закладів ", розробленої Всеросійським навчально-науково-методичним Центром по безперервному медичної та фармацевтичної освіти МОЗ Росії та УМЦпкп та затвердженої Керівником департаменту освітніх медичних установ та кадрової політики М.М. Володіним в 2000 р.
Дане Навчально-методичний посібник підготовлено для студентів для самостійної підготовки до практичних занять із зазначеної теми.

Тема: Методи вивчення кореляційних зв'язків

Питання:
- Кореляційний аналіз (основні поняття)
- Коефіцієнт парної кореляції
- Ранговий коефіцієнт (Спірмена)
- Визначення тісноти зв'язку між якісними ознаками (коефіцієнти Шарльє, Дзига, Пірсона)
Тривалість заняття: 4 години
Самостійна робота: лабораторна робота № 7

Теоретична частина

 

Кореляційний аналіз

У різних областях медицини, біології, організації охорони здоров'я, соціально-гігієнічних та клінічних дослідженнях проводяться статистичний аналіз зв'язків, вивчення закономірностей і факторів, що впливають.
Існують два види прояву кількісних взаємозв'язків між ознаками (явищами, факторами) - функціональні і кореляційні.
При функціональних залежностях кожному значенню однієї змінної величини відповідає одне цілком визначене значення іншої змінної. Такі залежності спостерігаються в математиці й фізиці. Різні вимірювальні прилади засновані на функціональній залежності (висота ртутного стовпчика дає однозначну відповідь про температуру).
Кореляційні або статистичні зв'язку, при яких чисельному значенню однієї змінної відповідає багато значень іншої змінної. Приклад, між зростом і вагою дітей існує безперечна залежність, але це не означає, що певного зростання строго відповідає певний вагу. У силу участі у формуванні ваги багатьох інших факторів, кожному значенню зростання відповідає кілька значень ваги, які можуть бути виражені у вигляді розподілу.
Функціональний зв'язок має місце по відношенню до кожного конкретного спостереження. Кореляційна проявляється в середньому для всієї сукупності спостережень. виявлення взаємодії факторів, визначення сили і спрямованості Практичне використання кореляційного аналізу: виявлення взаємодії факторів, визначення сили та напрямку впливу одних факторів на інші.
Слід підкреслити, що визначення наявності зв'язку між явищами і факторами - справа фахівців. Статистика лише вимірює цей зв'язок.
Кореляційна залежність відрізняється за формою зв'язку, її напрямку і силі. Орієнтовна уявлення про характер залежності між двома вивченими факторами дає графічний аналіз (так звана «скеттер-діаграма»), який дозволяє розглянути концентрацію і розсіювання точок на перетині координат досліджуваних ознак у певному напрямку навколо лінії регресії.
Форма зв'язку може бути прямолінійною і криволінійною. Прямолінійна зв'язок - рівномірні зміни однієї ознаки відповідають рівномірним змін другої ознаки при незначних відхиленнях. Криволінійна зв'язок - рівномірні зміни однієї ознаки відповідають нерівномірним змін другої ознаки.
Напрямок зв'язку може бути пряме (позитивне) або зворотне (негативне). Якщо зі збільшенням однієї ознаки другій також збільшується або зі зменшенням одного інший теж зменшується, залежність пряма, позитивна. Якщо зі збільшенням однієї ознаки іншого зменшується чи із зменшенням першої ознаки другий збільшується, залежність зворотна, негативна.
За силою зв'язку залежність може бути сильна (сильно виражена), середня (помірно виражена), слабка (слабо виражена).

Оцінка сили зв'язку за величиною коефіцієнта кореляції

Розмір зв'язку
Характер зв'язку
Пряма (+)
Зворотна (-)
Відсутній
0
0
Слабка
Від 0 до +0,29
Від 0 до -0,29
Середня
Від +0,3 до +0,69
Від -0,3 до -0,69
Сильна
Від +0,7 до +0,99
Від -0,7 до -0,99
Повна (функціональна)
+1,0
-1,0
Кількісна характеристика взаємозв'язку досліджуваних ознак може бути дана на підставі обчислення показників сили зв'язку між ними (коефіцієнти кореляції) і визначення залежності однієї ознаки від зміни іншого (коефіцієнт регресії).

Коефіцієнт парної кореляції

Коефіцієнт парної кореляції обчислюється за формулою:
або
Алгоритм розрахунку коефіцієнта парної кореляції:
1) записують вихідні дані в два варіаційних ряду - x і y;
2) обчислюють середню арифметичну ряду x і y;
3) визначають різницю між членом ряду і середніми величинами;
4) перемножують різниці ряду x і y між собою;
5) знаходять суму перемножуваних різниць (з урахуванням арифметичного знаку);
6) зводять квадрат кожну різниця (відхилення) ряду х і у;
7) визначають суму квадратів відхилень (різниць) для ряду х і в окремо;
8) підставляють отримані дані у вихідну формулу і обчислюють коефіцієнт парної кореляції.

Приклад. Визначити кореляційний зв'язок між рядками введення протидифтерійної сироватки та летальністю від цього захворювання.
День введення сироватки (х)
Летальність (у)
d x
d y
d x 2
d y 2
d x * d x
1-й
2,0
-2
-5
4
25
10
2-й
3,0
-1
-4
1
16
4
Третя
7,0
0
0
0
0
0
4-й
9,0
+1
+2
1
4
2
5-й
14,0
+2
+7
4
49
14
x x = 3
x y = 7.0
Sd x = 0
Sd y = 0
Sd x 2 = 10
Sd y 2 = 94
Sd x * d y = 30

Коефіцієнт кореляції дорівнює +0,98. Зв'язок позитивна, сильна. Отже, між термінами введення сироватки та летальністю від дифтерії є дуже тісна залежність. Число хворих у цьому прикладі дорівнює 900.
Можна визначити достовірність коефіцієнта кореляції, обчисливши його середню помилку для великого числа спостережень (n> 50) за формулою:
, Або при меншій кількості спостережень:
З достатньо великою надійністю можна стверджувати, що залежність невипадкова, якщо чисельне значення r xy перевищує свою середню помилку не менш ніж в 3 рази.


Тобто зв'язок між ознаками вважається статистично значущою, якщо коефіцієнт кореляції перевищує свою помилку в 3 і більше разів
У тому випадку, коли відношення коефіцієнта кореляції до його середньої помилки менше 3, існування зв'язку між досліджуваними явищами не можна визнати доведеним.
Для малого числа спостережень (n £ 30) ступінь надійності коефіцієнта кореляції може визначатися за спеціальною таблицею. При цьому число спостережень таблиці К (число ступенів свободи n ) Дорівнює кількості спостережень у дослідженні без двох, тобто К = n-2. Як правило, коефіцієнт кореляції розраховується при числі корелюється пар не менше 5.
У медичних і біологічних дослідженнях зв'язок між ознаками вважається статистично значущою, якщо величина коефіцієнта кореляції більше або дорівнює табличній при Р = 0,05
Показники оцінки коефіцієнта кореляції при малому числі спостережень
K
P
0,1
0,05
0,02
0,01
1
0,988
0,997
0,9995
0,99988
2
900
950
980
990
3
800
878
934
959
4
729
811
882
917
5
669
754
883
874
6
662
707
789
834
7
582
666
750
798
8
549
632
716
765
9
521
602
685
735
10
497
576
658
708
11
476
532
634
684
12
458
532
612
661
13
441
514
592
641
14
426
497
574
623
15
412
482
558
606
16
400
468
542
590
17
389
456
528
575
18
378
444
516
561
19
369
433
503
549
20
360
423
492
537
25
323
381
445
487
30
296
349
409
449
35
275
325
381
418
40
257
304
358
393
45
243
288
338
354
50
231
273
322
354
60
211
250
295
325
70
195
232
274
302
80
183
217
256
283
90
173
205
242
267
100
164
195
230
254
Приклад. У районах вивчалася залежність між охопленням населення щепленнями і рівнем захворюваності. Отриманий коефіцієнт кореляції за цими двома ознаками дорівнював 0,81. Число спостережень - 8 районів (пар), отже, К дорівнює 6 (8-2). По таблиці знаходимо рядок 6 і порівнюємо отриманий коефіцієнт. При даному числі ступенів свободи (К) коефіцієнт кореляції перевищує табличний для ймовірності Р = 0,05 (графа 3). Звідси з ймовірністю, більшою, ніж 95%, можна стверджувати, що залежність між охопленням населення щепленнями і захворюваністю не випадкова, і цей зв'язок сильна, тобто чим більше відсоток щеплених, тим менше рівень захворюваності.
Ранговий коефіцієнт (Спірмена)
Ранговий коефіцієнт кореляції більш придатний в порівнянні зі звичайним коефіцієнтом для характеристики кореляцій у випадках нелінійної зв'язку і для даних, розподіл яких відрізняється від нормального. Крім того, дані для розрахунку рангового коефіцієнта можуть бути представлені в напівкількісних вимірах. Досить орієнтовних даних про рівень ознаки. Обчислення коефіцієнта проводиться за формулою:
.
Алгоритм розрахунку коефіцієнта кореляції рангів:
1) замінюють кількісні (або напівкількісний, або якісні) ознаки ряду х і у на ранги, ранжуючи при цьому строго від меншої величини до більшої (або суворо від більшої до меншої на розсуд дослідника);
2) визначають умовні відхилення (а), тобто різницю рангів по кожному рядку;
3) зводять умовні відхилення в квадрат;
4) визначають суму квадратів умовних відхилень;
5) підставляють отримані дані у відому формулу і обчислюють коефіцієнт кореляції.
Приклад. Виміряти кореляцію між смертністю від раку молочної залози і раку матки (матеріали смертності 5 позаєвропейських країн за 1950 - 1952 рр..),
Країна
Смертність від раку молочної залози на 100000 жінок
х
Смертність від раку матки на
100000 жінок
у
Порядкові номери (ранги) за розмірами смертності від раку
Різниця рангів
а
Квадрат різниці рангів
а 2
молочної залози
матки
Нова Зеландія
28,6
14,9
1
4
3
9
Австралія
23,5
13,4
2
5
3
9
ПАР
21,1
16,3
3
2
1
1
Чилі
5,8
15,3
4
3
1
1
Японія
3,3
19,1
5
1
4
16
2 = 36

Оскільки обчислення коефіцієнта кореляції рангів зазвичай проводиться на малому числі спостережень (кількість пар в лавах х, у), особливого значення набуває оцінка статистичної значущості (достовірності) цього коефіцієнта. Це тим більше важливо, тому що ранговий коефіцієнт завжди менш точний, ніж парний коефіцієнт кореляції.
Оцінка достовірності коефіцієнта кореляції рангів проводиться різними методами в залежності від числа спостережень. При числі парних спостережень, рівномірному-менш 9 (n £ 9), оцінка значимості проводиться за спеціальною таблицею. При числі спостережень від 10 і більше оцінка значимості може здійснюватися за допомогою критерію t за формулою:
.
Використовуючи таблицю значень t Стьюдента, при числі ступенів свободи без двох (n `= n-2), порівнюють обчислене значення з табличним. Коефіцієнт визнається значущим за умови, якщо розрахункове t> t 0,05 табличного.
Критичне значення коефіцієнтів кореляції Спірмена - r
n
Рівні значущості
n
Рівні значущості
5%
1%
5%
1%
4
1,000
16
0,425
0,601
5
0,900
1,000
18
0,399
0,564
6
0,829
0,843
20
0,377
0,534
7
0,714
0,893
22
0,359
0,508
8
0,643
0,833
24
0,343
0,485
9
0,600
0,783
26
0,329
0,465
10
0,564
0,746
28
0,317
0,448
12
0,506
0,712
30
0,306
0,435
14
0,456
0,645
Коефіцієнт кореляції визнається значущим (достовірним), якщо обчислене r £ r 0,05.
У розглянутому прикладі число спостережень менше 9 (n = 5), внаслідок чого оцінка коефіцієнта проведена за таблицею. При числі спостережень, що дорівнює 5, розрахований значення r =- 0,80 менше критичного і тому не можна з достатньою вірогідністю стверджувати, що між смертністю від раку молочної залози і раку матки існує якась залежність.
Визначення тісноти зв'язку між якісними ознаками
При вивченні залежності якісних ознак використовується коефіцієнт спряженості. Для визначення тісноти зв'язку в разі альтернативної залежності двох зіставляються ознак (дані, як правило, представлені в четирехпольние таблиці) коефіцієнти спряженості розраховуються за формулами:
коефіцієнт контингенции Шарльє:

коефіцієнт асоціації Юла (Q):
.
Алгоритм розрахунку:
1) шифрують через a, b, c, d чотири поля, в яких розташовані вихідні дані: ;
2) обчислюють послідовно твори a * d і b * c;
3) розраховують чисельник формули;
4) визначають знаменник формули;
5) обчислюють коефіцієнт Шарльє або Юла.
Приклад. Визначити залежність між методами лікування (хірургічний і рентгенотерапія, тільки хірургічний) і результатами (одужання чи ні одужання).
Метод
Одужання
Ні одужання
Усього хворих
I
14 (a)
8 (b)
22 (a + b)
II
7 (c)
9 (d)
16 (c + d)
Усього:
21 (a + c)
17 (b + d)
38 (a + b + c + d) = N

.
Примітка. Коефіцієнт асоціації дає швидку, але орієнтовну оцінку зв'язку. Досить точну величину коефіцієнт Q визначає для значень r між 1,5 і 0,5.
У тих випадках, коли якісні фактори мають не альтернативне варіювання (чотири поля), а більше число угруповань, коефіцієнт спряженості обчислюється за формулою:
,
де j 2 (фі-квадрат) - коефіцієнт контингенции Пірсона.
Алгоритм розрахунку:
1) становлять кореляційну таблицю;
2) частоти (числа спостережень) вписують зверху кожної клітини таблиці;
3) частоти зводять у квадрат і результат записують під ними;
4) квадрат частот ділять на суму числа спостережень (частот) кожної графи таблиці (див. приклад розрахунку: 625:46 = 12,7; 225:75 = 3 і т.д.);
5) приватні від ділення проставляють внизу кожної клітини таблиці;
6) визначають суму приватних від ділення по кожному рядку і записують у нижній частині підсумкової клітини таблиці (12,7 +3,0 +2,0 = 17,7 і т.д.);
7) зазначені суми ділять на відповідні підсумки рядків (сума від числа спостережень за рядком): 17,7:50 = 0,35; 24,5:60 = 0,4 і т.д.;
8) обчислюють значення j 2, який є сумою отриманих вище приватних від ділення без одиниці (j 2 = 1,28-1 = 0,28);
9) отримане значення j 2 підставляють у формулу і обчислюють коефіцієнт спряженості С.
Приклад. Обчислити коефіцієнт спряженості при вимірюванні тісноти зв'язку між житловими умовами і захворюваністю обстежуваних.
Житлові умови
Розподіл обстежуваних за частотою захворювань
Разом
Частота хворіють
Епізодично хворіють
Чи не хворіють
Незадовільні
25
15
10
50
25 2 = 625
225
100
12,7
3
2
17,7
0,35
Задовільні
18
36
6
60
324
1296
36
6,6
17,3
0,6
24,5
0,4
Хороші
6
24
40
70
36
576
1600
0,8
7,7
28,6
37,1
0,53
25 +18 +6 = 49
75
56
180
0,35 +0,4 +0,53 = 1,28
, Звідси .
Величина С дозволяє судити про наявність середньої кореляційного зв'язку між розглянутими факторами.

Контрольні питання
1. Дайте визначення кореляційної залежності, форма зв'язку, напрямок зв'язку.
2. Оцінка сили зв'язку за величиною коефіцієнта кореляції.
3. Коефіцієнт парної кореляції.
4. Ранговий коефіцієнт Спірмена.
5. Визначення тісноти зв'язку між якісними ознаками.

ТЕСТИ до практичного заняття по темі
«Методи вивчення кореляційних зв'язків»
1. Найбільш простим методом визначення ступеня зв'язку між ознаками є:
1) метод Спірмена
2) метод контингенции Пірсона
3) метод стандартизації 1.
2. Найбільш точним методом визначення ступеня зв'язку між якісними ознаками є:
1) метод парної кореляції
2) метод рангової кореляції
3) j 2 (фі-квадрат)
3. Кореляційний зв'язок може бути прямою і
1) зворотного
2) непрямої
4. Коефіцієнт кореляції, рівний нулю, свідчить:
1) про відсутність зв'язку між явищами
2) про слабку зв'язку між явищами
3) про слабку негативного зв'язку між явищами
5. Коефіцієнт кореляції, рівний одиниці, свідчить:
1) про наявність функціонального зв'язку між явищами
2) про наявність сильної кореляційної зв'язку між явищами
6. Коефіцієнт рангової кореляції розраховується при числі корелюється пар:
1) не менше 5
2) не менше 30
3) не менше 10
7. Зв'язок між ознаками вважається статистично значущою, якщо величина коефіцієнта кореляції більше або дорівнює табличній при:
1) Р = 0,05
2) Р = 0,5
3) Р = 0,2
8. Зв'язок між ознаками вважається статистично значущою, якщо коефіцієнт кореляції перевищує свою помилку:
1) в 3 і більше разів
2) в 2 і більше разів
3) в 1,5 і більше разів
9. Коефіцієнт кореляції, рівний «-0,3», свідчить:
1) про слабку негативного зв'язку між явищами
2) про середню негативного зв'язку між явищами
3) про відсутність зв'язку між явищами
10. Кореляційний зв'язок характеризується відповідністю:
1) кількох значень однієї ознаки одного значення другої ознаки;
2) одного значення першої ознаки суворо певному значенню другої ознаки.
11. Практичне використання кореляційного аналізу:
1) розрахунок узагальнюючих коефіцієнтів, які характеризують різні сторони кожного з досліджуваних ознак;
2) порівняння ступеня однорідності досліджуваних сукупностей;
3) визначення меж можливих коливань сукупностей;
4) виявлення взаємодії факторів, визначення сили та напрямку впливу одних факторів на інші.
12. Кореляційний аналіз використовується для:
1) розрахунку узагальнюючих коефіцієнтів, які характеризують різні сторони кожного з досліджуваних ознак;
2) порівняння ступеня однорідності досліджуваних сукупностей;
3) визначення меж можливих коливань вибіркових показників при даному числі спостережень;
4) виявлення взаємодії факторів, визначення сили і спрямованості.
13. Кореляційної називається зв'язок:
1) дає повну характеристику сукупності за її гомогенності, особливості розподілу двох порівнюваних ознак;
2) при якій значенням кожної величини однієї ознаки відповідає декілька значень іншого взаємопов'язаного з ним ознаки;
3) при якій будь-якому значенню одного з ознак відповідає строго певне значення іншого взаємопов'язаного з ним ознаки.
14. Функціональної називається зв'язок:
1) при якій значенням кожної величини однієї ознаки відповідає декілька значень іншого взаємопов'язаного з ним ознаки;
2) дає повну характеристику сукупності за її гомогенності, особливості розподілу двох порівнюваних ознак;
3) при якій будь-якому значенню одного з ознак відповідає строго певне значення іншого взаємопов'язаного з ним ознаки.
15. Кореляційний зв'язок визначається, як зв'язок:
1) при якій будь-якому значенню одного з ознак відповідає строго певне значення іншого взаємопов'язаного з ним ознаки;
2) при якій значенням кожної величини однієї ознаки відповідає декілька значень іншого взаємопов'язаного з ним ознаки;
3) дає повну характеристику сукупності за її гомогенності, особливості розподілу двох порівнюваних ознак.
16. Розрахунок коефіцієнта рангової кореляції використовується для:
1) визначення взаємозв'язку між двома змінними ознаками;
2) встановлення зв'язку між кількома статистичними сукупностями;
3) для характеристики кореляцій у випадках нелінійної зв'язку і для даних, розподіл яких відрізняється від нормального;
4) оцінки достовірності відмінності двох величин.
17. Умови для розрахунку коефіцієнта рангової кореляції:
1) для розрахунку використовуються негруппірованние ряди значень двох ознак;
2) досить орієнтовних даних про рівень ознаки;
3) розрахунок зміни величини однієї ознаки при зміні величини іншої ознаки на одиницю;
4) розрахунок проводиться тільки між кількісними ознаками.
18. Вкажіть правильну формулу для розрахунку коефіцієнта рангової кореляції:
1)
2)
3)
4)
19. Розрахунок використовується для:
1) визначення достовірності відмінності кількох сукупностей з розподілу в них якої-небудь ознаки;
2) оцінки достовірності відмінності двох середніх величин;
3) визначення взаємозв'язку між двома кількісними ознаками, один з яких представлений у вигляді інтервалів значень;
4) визначення взаємозв'язку між двома змінними кількісними ознаками.
20. Вкажіть правильну формулу для розрахунку коефіцієнта лінійної кореляції (Пірсона):

1)
2)
3)
21. Значення коефіцієнта кореляції, що перевищує табличне при Р = 95%, підтверджує статистичну:
1) достовірність;
2) недостовірність результатів.
22. Значення , Що перевищує табличне при Р = 95%, підтверджує статистичну:
1) достовірність;
2) недостовірність результатів.
УСТАНОВИТЕ ВІДПОВІДНІСТЬ
23. Кореляційний зв'язок:
Значення

1) пряма сильна;
2) пряма слабка;
3) зворотний слабка;
4) зворотний середньої сили.
Однією цифрі відповідає тільки одна буква.
А.
Б.
В.
Г.
Д.
Є.
Ж.
З.
0,2
0,9
-0,4
-0,12
1,5
-1,1
-2,4
1,1
24. Кореляційний зв'язок:
Значення

1) пряма слабка;
2) зворотний середньої сили;
3) пряма сильна;
4) зворотний сильна.
Однією цифрі відповідає тільки одна буква.
А.
Б.
В.
Г.
Д.
Є.
Ж.
З.
0,95
-0,2
-0,5
-0,9
0,24
-1,0
-1,1
-2,8
25. Кореляційний зв'язок:
Значення

1) пряма слабка;
2) зворотний середньої сили;
3) пряма сильна;
4) зворотний слабка.
Однією цифрі відповідає тільки одна буква.
А.
Б.
В.
Г.
Д.
Є.
Ж.
З.
-0,5
1,4
0,1
-0,2
-1,4
0,9
2,0
-0,95
26. Кореляційний зв'язок:
Значення

1) зворотний слабка;
2) пряма сильна;
3) зворотний середньої сили;
4) пряма слабка.
Однією цифрі відповідає тільки одна буква.
А.
Б.
В.
Г.
Д.
Є.
Ж.
З.
0,39
0,11
0,9
1,3
-0,27
-0,56
0,9
-1,42
27. Кореляційний зв'язок:
Значення

1) пряма сильна;
2) зворотний середньої сили.
3) пряма слабка;
4) зворотний слабка;
Однією цифрі відповідає тільки одна буква.
А.
Б.
В.
Г.
Д.
Є.
Ж.
З.
1,0
-0,2
0,6
-0,65
0,25
0,9
-0,8
2,5
Додати в блог або на сайт

Цей текст може містити помилки.

Медицина | Методичка
183.1кб. | скачати


Схожі роботи:
Статистичні методи вивчення взаємозв`язків фінансових показників діяльності банку
Статистичні методи вивчення взаємозв`язків виробничих показників фірми на прикладі продуктивності
Статистичне вивчення взаємозв`язків
Вивчення хімічних зв язків і будови речовини
Вивчення видового складу та консортивні зв`язків комах
Вивчення видового складу та консортивні зв`язків комах на моніторингових майданчиках охоронюваних
Механізм та методи регулювання зовнішньоекономічних зв язків та діяльності
Види і методи досліджень у практиці зв`язків з громадськістю
Статистичні методи виявлення взаємозв`язків суспільних явищ
© Усі права захищені
написати до нас